见证历史！GPT-4发布：能玩梗能考律师！官网连夜被挤爆，用户直呼：强得离谱

21记者 21世纪经济报道 2023-03-26

作者丨杨清清

编辑丨张伟贤黎雨桐许婷婷

“见证历史了。”看到GPT4的发布后，有多位业内人士感叹道。

3月15日凌晨，OpenAI发布了多模态预训练大模型GPT-4，这也是其大型语言模型的最新版本。

与此前的版本相比，GPT-4具备强大的识图能力，文字输入限制也提升至2.5万字；GPT-4的回答准确性也显著提升，还能够生成歌词、创意文本从而实现风格变化。同时，GPT-4在各类专业测试及学术基准上也表现优良。

“这是OpenAI努力扩展深度学习的最新里程碑。”OpenAI介绍，“GPT-4是一个大型多模态模型，它接受图像和文本输入、进行文本输出，虽然在许多现实场景中它尚且不如人类，但在各种专业和学术基准上表现出与人类相当的性能。”

GPT-4震撼发布：会玩梗还能考律师

从整体而言，GPT-4实现了多重能力的跃升。

OpenAI介绍称，在日常对话中，GPT-4与GPT-3.5之间的差距或许微妙，但当任务复杂度足够高的时候，GPT-4将具备更可靠、更具创造性的特点，且能够处理更细致的指令。

例如，根据OpenAI公布的实验数据，GPT-4通过模拟律师考试且分数在应试者的10%左右。相较之下，GPT-3.5版本大模型的成绩是倒数10%。

需要注意的是，相较于此前的GPT模型而言，GPT-4最大的突破之一是在文本之外还能够处理图像内容。OpenAI表示，用户同时输入文本和图像的情况下，它能够生成自然语言和代码等文本。

OpenAI用一张“梗图”演示了GPT-4特有的多模态功能。在以下输入图片并设问“这些图片有何可笑之处？请逐一描述。”GPT-4便会在对每张图片进行表述后表示，“这幅图的幽默之处在于，把一个大而过时的VGA接口插入一个小而现代的智能手机充电端口是荒谬的。”

除了普通图片，GPT-4还能处理更复杂的图像信息，包括表格、考试题目截图、论文截图、漫画等。此外，在多语种方面，GPT-4也体现出优越性。在测试的26种语言中，GPT-4在24种语言方面的表现均优于GPT-3.5等其他大语言模型的英语语言性能，其中包括部分低资源语言如拉脱维亚语、威尔士语等。在中文语境中，GPT-4能够达到80.1%的准确性。

与此前的GPT模类似，GPT-4基础模型可在训练完预测文档中的单词。在数据样本方面，也同样使用公开可用的数据及许可数据。为了提升基础模型回应与用户之间意图的匹配性，OpenAI同样选择了强化学习人类反馈（RLHF）来微调模型行为。

不过，OpenAI指出，在模型训练方面，GPT-4建立了可预测扩展的深度学习栈。通过开发基础设施及优化，在多种规模下都可进行预测。为验证其可扩展性，团队提前准确预测了GPT-4在内部代码库上的优化指标，但使用的计算量仅为万分之一。

尽管GPT-4功能强大，但同时OpenAI也坦言，与早期GPT模型类似，GPT-4也具备局限性。GPT-4依然会形成推理错误，因而在使用语言模型输出时需要非常小心，最好以人工核查、附加上下文或避免高风险使用的方式予以辅助。

“GPT4的模型发布，本身是技术持续升级迭代发展的必然阶段。AI行业每一年都会有些新模型发布，趋势就是大模型、多模态。”在接受21世纪经济报道记者采访时，IDC中国研究总监卢言霞表示，“多模态肯定是必然趋势，毕竟AI要真正达到人的智慧，需要处理多模数据。且在各行业场景里，大都是涉及多模态数据的处理。”

OpenAI付款系统被挤爆

首批用户连夜写测评

目前，ChatGPT的Plus订阅用户已经可以使用GPT-4，其他用户需要排队申请内测。

据财联社报道，当天凌晨，在部分微信群，记者看到有不少用户不眠不休测试GPT-4的表达：或用来出营销策划、写广告词；或用于解答逻辑题、数学题；甚至还有用来调侃脑筋急转弯。GPT-4均对答入流，并展示出其强悍的处理能力，用户直呼“强得离谱”、“牛啊”。

更有用户连夜写出了一份测评：

由于仅限于Plus订阅用户使用，当晚，大批新订用户涌入，以至于OpenAI的付款系统被挤爆了。

已在必应中应用

从商业应用角度而言，目前GPT-4没有免费版本。

不过在GPT-4发布后，OpenAI也直接升级了ChatGPT，目前，GPT-4的访问权限仅面向ChatGPT Plus的付费订阅用户及企业和开发者开放。

想要访问GPT-4的API，用户可以注册等待，OpenAI将邀请部分开发者进行体验。

此外，在GPT-4发布后，微软方面则宣布，目前全新必应预览版中已经搭载了定制版本的GPT-4。

“如果您在过去五周内的任何时间使用过新的必应预览版，那么您已经体验过这个强大模型的早期版本。”微软表示，“随着OpenAI对GPT-4及更高版本进行更新，必应将从这些改进中受益。”

事实上，GPT-4的应用空间还是颇具想象的。目前，微软已经将 ChatGPT整合进云平台Azure Open AI 中，企业和个人开发者均可借助Azure

Open AI功能直接集成到应用产品中，通过私人定制ChatGPT来提供个性化客户服务，建立企业级智能化知识库搜索引擎等。

“微软有望在产业中通过GPT-4不断拓展下游新兴领域，应用于更多的场景中，并利用其多模态模型成本改变传统AI客制化与定制化的特点，逐步向通用化方向发展。”华鑫证券计算机研究团队分析称。

浙江大学国际联合商学院数字经济与金融创新研究中心联席主任、研究员盘和林在接受21世纪经济报道记者采访时评论称，GPT-4的核心能力提升体现为基本智能水平提升、多模态模型方面，后者意味着对文字互动形式的突破，识别能力扩展至图片领域。

在商业落地方面，盘和林指出，GPT-4一经发布，支付渠道就出现了拥堵，用户热情是足够的，“这也就意味着当前OpenAI实际上没有商用落地的忧虑，这款产品已经可以实现变现。”

此前有业内观点认为，GPT-4的发布有望成为生成式AI向超级AI快速演变的关键节点，而此次GPT-4真正亮相后，也引爆了业内讨论。

“GPT-4和GPT-3的主要区别在于模型的规模和能力，其多模态的模型超出文本范围实现了对图像乃至视频的AI生成，同时突破生成文本的语种限制，实现多语种语言数据的输入输出。”华鑫证券计算机研究团队表示，“这是一场伟大的变革，AI可干的事越来越多，也许未来它将成为人类得心应手的工具。”

部分内容来自财联社

SFC

本期编辑黎雨桐实习生余心雨

21君荐读

ChatGPT火出圈：

关于ChatGPT，科技部发声了！

多地出台AI产业政策！关于ChatGPT，北京率先表态

ChatGPT背后的人工智能安全隐患与对策

爆火的ChatGPT暗藏风险，或将取代部分职业

深度丨昂贵的ChatGPT背后

AI怎么看AI？我们和ChatGPT聊了聊

再造一个ChatGPT？并没想象的容易

bxrf的瓜

”FAN某”的离婚财产分割判决书（全文）

”FAN某”的离婚财产分割判决书（全文）

公益慈善｜“翼行天下一生守护”慈善项目捐赠仪式圆满举行！

何炅突然高调官宣喜讯，网友恭喜：30年了，终于等到这一天！

见证历史！GPT-4发布：能玩梗能考律师！官网连夜被挤爆，用户直呼：强得离谱

ChatGPT火出圈：

关于ChatGPT，科技部发声了！

多地出台AI产业政策！关于ChatGPT，北京率先表态

ChatGPT背后的人工智能安全隐患与对策

爆火的ChatGPT暗藏风险，或将取代部分职业

您可能也对以下帖子感兴趣

bxrf的瓜

”FAN某”的离婚财产分割判决书（全文）

”FAN某”的离婚财产分割判决书（全文）

公益慈善｜“翼行天下 一生守护”慈善项目捐赠仪式圆满举行！

何炅突然高调官宣喜讯，网友恭喜：30年了，终于等到这一天！

生成图片，分享到微信朋友圈

见证历史！GPT-4发布：能玩梗能考律师！官网连夜被挤爆，用户直呼：强得离谱

ChatGPT火出圈：

关于ChatGPT，科技部发声了！

多地出台AI产业政策！关于ChatGPT，北京率先表态

ChatGPT背后的人工智能安全隐患与对策

爆火的ChatGPT暗藏风险，或将取代部分职业

您可能也对以下帖子感兴趣

公益慈善｜“翼行天下一生守护”慈善项目捐赠仪式圆满举行！